AI 史话_草庐IT

AI新工具(20240221) OOTDiffusion-虚拟试穿技术的实现；Groq-世界上最快的大模型，每秒可以输出近500个token

OOTDiffusion-虚拟试穿技术的实现OOTDiffusion是一种基于潜在扩散的虚拟试穿技术，其主要目的是通过实现控制性的换装融合，让用户能够在虚拟环境中试穿不同的服装。该技术通过融合最新的机器学习算法与图像处理技术，为用户提供了一种新颖的虚拟试穿体验。https://github.com/levihsu/OOTDiffusionSoraWebui-使用文本和OpenAI的Sora模型在线生成视频SoraWebui是一个开源项目，它的主要功能是利用OpenAI开发的Sora模型，通过文本输入在线生成视频，非常简便易用，还支持一键式网站部署。https://github.com/Sora

AIGC专题：Sora开启AIGC新纪元，海外龙头AI指引乐观

今天分享的是电子系列深度研究报告：《AIGC专题：Sora开启AIGC新纪元，海外龙头AI指引乐观》。（报告出品方：方正证券）报告共计：30页来源：人工智能学派Sora、Gemini1.5Pro相继发布，AIGC新时代已至大模型Sora震摅登场，Al生成视频领域里程碑0penAl在2024年2月16日发布文生视频模型Sora，突破了AIGC的高地，该模型完美继承DALL·E3的画质和遵循指令能力，并利用了GPT扩写，具备超长生成时间(60s，Pika1.0为3s)、单视频多角度镜头、理解物理世界三大突出优势。除文生视频外，该模型还能支持通过现有的静态图像生成视频，并能准确、细致地对图像内容进行

华为云携十大系统性创新亮相巴塞罗那打造最适合AI的基础设施

本文分享自华为云社区《华为云携十大系统性创新亮相巴塞罗那打造最适合AI的基础设施》，作者：华为云头条。近日，主题为“一切皆服务，加速千行万业智能升级”的华为云峰会在巴塞罗那隆重召开，汇聚来自运营商、金融、互联网等多个行业的超过500名企业高层和技术专家。华为云向与会者展示了面向AI的十大系统性创新以及盘古大模型的丰富行业实践，打造最适合AI的基础设施，加速千行万业智能化。华为高级副总裁、欧洲地区部总裁鲁勇在致辞中表示：“未来十年，智能化将是欧洲的巨大机会窗。华为希望利用所擅长的ICT技术，帮助全球客户和伙伴抓住智能化这一历史性的战略机遇，我们也希望与欧洲的客户和伙伴持续合作，共同推动千行万业的

微软发布PyRIT，用于识别生成式AI系统中的风险

2月26日消息，据外媒报道，微软发布了一个名为PyRIT的开放访问自动化框架，用于主动识别生成式AI系统中的风险。微软人工智能红色团队负责人Ram Shankar Siva Kumar表示，红色团队工具旨在“使全球每个组织都能利用最新的人工智能进步进行负责任的创新”。该公司表示，PyRIT可用于评估大型语言模型(LLM)端点对不同伤害类别的稳健性，如捏造、滥用和禁止内容。并且还能用于识别从恶意软件生成到越狱的安全危害，以及身份盗窃等隐私危害。PyRIT有五个接口：目标、数据集、评分引擎、支持多种攻击策略的能力，以及包含一个内存组件，该组件可以采用JSON或数据库的形式来存储中间输入和输出交互。

2024年与AI一起出发，一步步迈向你的梦想

程序员的社交圈子几乎没有，而不是非常小，总是在两点一线之间往返，回忆起过往，自己错过了一班班划时代的列车。一、读书分享【财富的真相】李笑来所谓的个人财富自由，指的是某个人再也不用为了满足生活必需而出售自己的时间了。他强调概念的重要性，还说一个人的脑子是否清楚，就看他大脑中有多少正确的概念和概念之间的关系。最宝贵的财富是什么？不是时间，而是注意力。注意力>时间>金钱，这条简单而深刻的公式，直接决定了人生的效率。付费就是捡便宜，让我学会了付费从最牛的人那儿学习，让我以最快的速度进步的同时，节省了不知道多少时间。我们所有的财富都是从我们的时间里挖出来的，核心动作，就是自学。自学什么，自学生产知识、销

Arm推出新一代 Arm® Neoverse™ 技术：以更高性能和更低功耗赋能企业AI应用落地

数字时代，AI已经成为企业创新和发展的关键动力。随着云计算、5G、物联网技术的飞速发展，在小型终端和中大型数据中心、云中构建AI应用已经成为用户共识，但同样也带来了算力的挑战。近期，Arm宣布推出新一代Arm®Neoverse™技术,其中包括通过性能效率更优异的N系列新IP扩展ArmNeoverse计算子系统(CSS)产品路线图，推出NeoverseCSSN3；以及首次将计算子系统引入性能优先的V系列产品线，推出新的NeoverseCSSV3。近日，Arm高级副总裁兼基础设施事业部总经理MohamedAwad在接受记者采访时表示，AI有着非常庞大的计算需求，传统的通用CPU已经无法满足AI的算

干货满满！大神Karpathy两小时AI大课文字版第一弹，全新工作流自动把视频转成文章

前段时间，AI大神Karpathy上线的AI大课，已经收获了全网15万次播放量。当时还有网友表示，这2小时课程的含金量，相当于大学4年。就在这几天，Karpathy又萌生了一个新的想法：那便是，将2小时13分钟的「从头开始构建GPT分词器」的视频，转换为一本书的章节（或者博客文章）形式，专门讨论「分词」。具体步骤如下：-为视频添加字幕或解说文字。-将视频切割成若干带有配套图片和文字的段落。-利用大语言模型的提示工程技术，逐段进行翻译。-将结果输出为网页形式，其中包含指向原始视频各部分的链接。更广泛地说，这样的工作流程可以应用于任何视频输入，自动生成各种教程的「配套指南」，使其格式更加便于阅读、

谷歌AI新星转投Pika：视频生成Lumiere一作，担任创始科学家

视频生成进展如火如荼，Pika迎来一位大将——谷歌研究员OmerBar-Tal，担任Pika创始科学家。一个月前，还在谷歌以共同一作的身份发布视频生成模型Lumiere，效果十分惊艳。当时网友表示：谷歌加入视频生成战局，又有好戏可看了。StabilityAICEO、谷歌前同事等在内一些业内人士送上了祝福。Lumiere一作，刚硕士毕业OmerBar-Tal，2021年本科毕业于特拉维夫大学的数学与计算机系，随后前往魏茨曼科学研究所攻读计算机硕士，主要聚焦于图像和视频合成领域的研究。其论文成果多次被顶会接收，比如Text2LIVE（ECCV2022Oral）、MultiDiffusion（ICM

可控核聚变新里程碑！AI成功预测等离子体撕裂登Nature，清洁能源「圣杯」更近一步

可控核聚变，又有新突破了！长期以来，核聚变一直受着一个「幽灵」的困扰——等离子体不稳定性问题。而最近，普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态，这个时间，就足够约束磁场调整应对等离子体的逃逸！从此，科学家可以防止可控核聚变的中断，产生足够能量所需的高功率聚变反应，也就更有可能了。这项重大突破，成果已经登上Nature。论文地址：https://www.nature.com/articles/s41586-024-07024-9可控核聚变重大难题，被AI突破几十年来，科学家一直努力在地球上实现核聚变。因为人类社会未来面临的能源枯竭问题，很可能会被可控核聚变解决。它有望为我们提供

打入AI底层！NUS尤洋团队用扩散模型构建神经网络参数，LeCun点赞

扩散模型，迎来了一项重大新应用——像Sora生成视频一样，给神经网络生成参数，直接打入了AI的底层！这就是新加坡国立大学尤洋教授团队联合UCB、MetaAI实验室等机构最新开源的研究成果。具体来说，研究团队提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。用它来生成网络参数，速度比直接训练最多提高44倍，而且表现毫不逊色。这一模型一经发布，就迅速在AI社区引发强烈讨论，圈内人士对此的惊叹，毫不亚于普通人看到Sora时的反应。甚至有人直接惊呼，这基本上相当于AI在创造新的AI了。就连AI巨头LeCun看了之后，也点赞了这一成果，表示这真的是个cuteidea。而实质上，p